max rank | avg. rank | sentence |
---|---|---|
178 | 71.5000 | Au Sénégal, ce n’est pas encore le cas. |
201 | 61.8889 | Le Sénégal fait partie de ce groupe de pays ». |
226 | 61.3333 | Et le Sénégal ne doit pas être en reste. |
241 | 78.2308 | Ce n’est par contre pas le cas pour des personnes comme M. Diop. |
277 | 112.5000 | Mais on ne peut pas dire qu’on n’a rien fait. |
278 | 113.7500 | Tout est dit mais beaucoup reste à faire. |
310 | 71.3333 | C’est bien de le faire quand on le peut. |
317 | 138.1000 | Mais ils doivent savoir qu’ils ne sont plus au pouvoir. |
317 | 128.7000 | M. Ndiaye a fait savoir que la demande est là. |
325 | 94.1000 | « Le gouvernement doit mettre les moyens et il le fait. |
350 | 125.4545 | Je ne suis ni dans la politique, ni dans le gouvernement. |
352 | 94.0000 | Le nouveau Président de la République et son (. |
355 | 127.7778 | Ce qui compte c’est donner des services aux gens. |
369 | 86.3333 | Ce n’est pas comme la politique ou le football. |
370 | 123.4444 | Le point de vue du gouvernement est tout autre. |
378 | 145.3000 | Le gouvernement de Macky Sall est sur le point (. |
392 | 180.8571 | Sur le mobile, nous avons deux opérateurs. |
394 | 132.8000 | Et quelques soit la personne qui soit à sa tête. |
403 | 109.5556 | Il n’y avait que le Sénégal qui était là. |
403 | 87.3333 | Il n’y en a pas beaucoup dans le monde. |
406 | 113.5000 | De ce fait, on n’a pas une vie de famille. |
406 | 97.2727 | En plus de cela, on n’a pas une vie de famille. |
423 | 190.1429 | Cette dernière ne compte que quatre points. |
429 | 171.0000 | ''Cela ne demande pas beaucoup de moyens. |
434 | 117.3750 | Cette journée a également été un moment de (. |
449 | 178.6667 | Nous sommes au début du mois de février 2009. |
454 | 105.6667 | Le président de la République est quand même un chef de parti. |
459 | 131.2857 | Ce n’est pas la chose d’une personne. |
459 | 175.9000 | Il faut autre chose, d’autres hommes, pour un autre Sénégal. |
477 | 137.5000 | La décision de mettre en place ce fonds date de quelques mois. |
The maximum word rank of a sentence is by definition the rank of the rarest word in the sentence. If it is low, all words in the sentence are of high frequency. For this reason the table of the sentences with least maximum word number might be of interest. In the table, we see the corresponding sentences with a minimum length of 40 characters.
The over all distribution of the maximum rank in all sentences of the corpus is shown in a diagram with log-scaled x-axis.
The sentences in the table described above are of interest because they are usually easy to understand. The distribution may give insights into the corpus and may give parameters for language comparison.
While the distribution might be deduced from a small corpus, the sentences in the table are rare and a large corpus will give more impressive results.
Table data:
select max(w_id)-100 as m, avg(w_id)-100 as a, s.sentence from sentences s, inv_w i where s.s_id=i.s_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by m limit 30;
Distribution data;
select m, count(*) from (select 100* round((max(w_id)-100)/100) as m from sentences s, inv_w i where s.s_id=i.s_id and i.w_id>100 group by s.s_id) aa group by m;
Explain the distribution, especially the increase in its right part.
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.7 Sentences consisting of long words only I
4.5.2.8 Sentences consisting of long words only II